Índice:

  1. Introducción
    1. Tema
    2. Relevancia
    3. Objetivos
      1. Objetivos Generales
      2. Objetivos Específicos
    4. Contexto
  2. Datos
    1. Recolección de datos
    2. Población, muestra y muestreo
    3. Variables
    4. Limpieza de datos
  3. Análisis Descriptivo

1. Introducción

1.1 Tema

Análisis de las ventas en la industria de videojuegos comprendidos entre los años 2015 a 2016 mediante una base de datos.

1.2 Relevancia

Como en la industria de videojuegos en la actualidad genera casi lo mismo o más que la industria de cine y la música actualmente , por ello hemos visto convenientes que las inversora de la industrias de videojuegos puedan saber a qué sector invertir para obtener las mayoras ganancias posibles en las diversa regiones de Europa ,América, países como Japón entre otros con el fin de que estas pueden tener gustos diferentes o similares , también de conocer los riesgos en estos mercados y saber el con que desarrolladora y distribuidora contar. Además de tener en cuenta las críticas de los videojuegos pública y profesional, la calificaciones de edad y los tipos de juegos mas demandado .Por ello, hemos analizado los juegos lanzados de 2015 a 2016 para tener una idea de como fue el mercado durante este tiempo para conocer los éxitos y fracasos que hubo.

1.3 Objetivos

  • Es importante tener un objetivo claro antes de comenzar el análisis para garantizar que el análisis sea relevante y útil.

1.3.1 Objetivos Generales

  • Determinar cuáles fueron las categorías de los juegos más vendidos además como influye en el desarrollo de la industria de los videojuegos.
  • Comparar las ventas de videojuegos en diferentes regiones geográficas y determinar las diferencias en los patrones de compra de los consumidores. Predecir las ventas futuras de videojuegos en la industria utilizando modelos estadísticos y de aprendizaje automático.

1.3.2 Objetivos Específicos

  • Examinar los videojuegos por país (Europa,Norteamérica y Japón )
  • Analizar cuáles fueron los distribuidores de videojuegos con más publicaciones.
  • Precisar que desarrolladora de videojuegos fue la más demandante.
  • Identificar patrones y tendencias de venta en la industria de los videojuegos entre 2015 y 2016, incluyendo los géneros de videojuegos más populares y las plataformas de juegos más utilizadas.
  • Analisar que plataformas de videojuegos dominaron mas en el año 2015 y 2016, a su vez en que año dichas plataformas tuvieron mas demandas.
  • Tendencias de clasificaciones de edad por género de videojuego.

1.4 Contexto

El análisis de las ventas en la industria de videojuegos entre los años 2015 y 2016 es de gran relevancia para comprender el desempeño y las tendencias del mercado en este sector en constante evolución. A través de una base de datos específica, se busca examinar y entender las ventas en esta industria durante ese período.

La industria de los videojuegos ha experimentado un crecimiento significativo en las últimas décadas, convirtiéndose en una forma de entretenimiento popular y altamente lucrativa a nivel mundial. El análisis de las ventas en este sector proporciona información crucial sobre los patrones de consumo, las preferencias de los jugadores y el éxito de los diferentes títulos y géneros de videojuegos.

Con el análisis de las ventas de videojuegos entre 2015 y 2016, se pretende identificar patrones de ventas, explorar relaciones entre variables relevantes y examinar las tendencias de consumo de videojuegos durante ese período específico.

El conocimiento necesario para comprender este análisis incluye una comprensión básica de la industria de los videojuegos, así como de los términos y métricas utilizados en el contexto de las ventas de videojuegos. Además, se requiere familiaridad con técnicas de análisis de datos y visualización para interpretar adecuadamente los resultados obtenidos.

2. Datos

La base de datos proporcionada contiene información detallada, como el nombre del videojuego, la plataforma, el año de lanzamiento, el género, el editor, las ventas en diferentes regiones, las ventas globales, las puntuaciones de los críticos y usuarios, la cantidad de críticas y usuarios, el desarrollador y la clasificación por edad recomendada (“Rating”).

2.1 Recolección de datos

La página web de donde fue sacada la información de datos fue la siguiente: “kaggle.com”

Para nuestros instrumentos de recolección nos basamos en los siguientes criterios:

  • La reputación de la fuente: La fuente es conocida por ser confiable y precisa, es por ello que lo más probable es que sus datos sean confiables. Ademas de que fue recomendada por el profesor.
  • La metodología utilizada para recopilar los datos: Se utilizó un método riguroso y estandarizado para recopilar los datos. La precisión y la integridad de los datos: Pese a la existencia de pocos datos atípicos o nulos en la base de datos, gran parte de los datos fue recopilada de una forma precisa.
  • La transparencia y la accesibilidad de los datos: Los datos están disponibles públicamente y se proporciona información clara sobre cómo se recopilaron, debido a esto es que es más probable que estos sean confiables.
  • Esta base de datos tiene información acerca de los juegos descargados desde los años 1980 hasta el 2016, nosotros resumimos la base de datos para analizarlo desde el 2015 hasta 2016 esto con el fin de tener datos más actualizados.

Para ser precisos la base de datos descargado lo encontramos en el siguiente link:: “https://www.kaggle.com/datasets/gregorut/videogamesales

2.2 Población, muestra y muestreo

Población:

La población es 16 598 registros de videojuegos con la condición de que tengan en común lograr superar las 100 000 copias

Muestra y muestreo:

La muestra que hemos elegido son los juegos de 2015 a 2016 que contiene 455 videojuegos que superaron la 100 000 copias ya que son los datos más actuales que teníamos de la data la cual nos permite hacer comparaciones con la actualidad debido a que la gran parte de compañías durante esa época siguen en la actualidad participando los cuales les seria útiles la información brindada.

El tipo de muestra es No probabilístico, debido a que contamos con una gran cantidad de datos para el año 2015 y a 2016 , con toda su información completa de 16 tipos de variables .

2.3 Variables

Para realizar el estudio hemos contado con las siguientes variables.

Nombre de variable Tipo de variable Descripción de variable
Name Cualitativa nominal Esta variable contiene el nombre de los videojuegos del estudio.
Platform Cualitativa nominal Esta variable contiene la plataforma donde fueron lanzados los videojuegos.
year_of_realese Cuantitativa continua Esta variable contiene el año de lanzamiento de los videojuegos.
Genre Cualitativa nominal Esta variable contiene el género de los videojuegos.
Publisher Cualitativa nominal Esta variable contiene la entidad que publicó el videojuego.
NA_sales Cuantitativa continua Esta variable contiene el número de ventas de los videojuegos en Norteamérica.(En millones)
EU_sales Cuantitativa continua Esta variable contiene el número de ventas de los videojuegos en Europa.(En millones)
JP_sales Cuantitativa continua Esta variable contiene el número de ventas de los videojuegos en Japón.(En millones)
Other_sales Cuantitativa continua Esta variable contiene el número de ventas de los videojuegos en el resto del mundo.(En millones)
Global_sales Cuantitativa continua Esta variable contiene el número de ventas totales de los videojuegos en todo el mundo.(En millones)
Critic_score Cuantitativa continua Esta variable contiene el número de la calificación de juego según críticos profesionales del 1 al 100 de puntuación.
Critic_count Cuantitativa continua Esta variable contiene el número de los profesionales que realizaron la crítica(En unidad)
User_score Cuantitativa continua Esta variable contiene el número de la calificación por el público que realizaron la crítica, la puntuación el del 1 al 100 de puntuación.
User_count Cuantitativa continua Esta variable contiene el número del público que realizaron la crítica.
Developer Cualitativa nominal Esta variable contiene la entidad que desarrolló el videojuego.
Rating Cualitativa ordinal Esta variable contiene la clasificación por categoría de edad recomendada para el juego,(“E” para todas las edades, “E10” de 10 o más,“T”para adolescentes o más, “M” para 17 o más,“A”solo para mayores de 18).

2.4 Limpieza de Datos

  • Primero reconocemos donde esta ubicado nuestro archivo con el getwd.

  • Luego cargamos el archivo juegos.csv y lo asignamos a la variable juegos.

  • Hemos utilizado la función deleate.na para eliminar las filas que no tengan data.

library(dplyr)
## Warning: package 'dplyr' was built under R version 4.1.3
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
getwd()
## [1] "D:/Anthony_Trabajo/UTEC/Documentos - 2023-1/Seccion 3/Nota Alta/202310301-Ventas Videojuegos/Informe 1"
juegos=read.csv("juegos.csv")
juegos
delete.na <- function(df, n=0) {  #ELIMINAR LAS FILAS QUE NO TENGAN DATA 
 df[rowSums(is.na(df)) <= n,]   
  
}
  • En esta parte asignamos lo hecho antes a la variable juegos_sin_0
juegos_sin_0 = delete.na(juegos)     #Guardado 
juegos_sin_0
  • Como tenemos datos muy antiguos nosotros nos hemos especificado entre los años 2015-2016.

  • Luego asignamos estos nuevos datos a la nueva variable juegos2015_2016.

juegos2015_2016=juegos_sin_0[juegos_sin_0$Year_of_Release >= 2015 & juegos_sin_0$Year_of_Release <= 2017 , ] ##quedarme solo con los años 2015 a 106
juegos2015_2016
#juegos2015_2016[1,]##sola para la primera fila
#Algunas variables no estaban clasificadas correctamente, debido a esto, se tuvo que cambiarlas al tipo de variable que pertenecían.
# Convertir las columnas de ventas a tipo numérico
juegos2015_2016$NA_Sales <- as.numeric(juegos2015_2016$NA_Sales)
juegos2015_2016$EU_Sales <- as.numeric(juegos2015_2016$EU_Sales)
juegos2015_2016$JP_Sales <- as.numeric(juegos2015_2016$JP_Sales)
juegos2015_2016$Other_Sales <- as.numeric(juegos2015_2016$Other_Sales)

3. Análisis descriptivo

Comparar las ventas en diferentes regiones con el género de videojuego: North America

# Filtrar los datos solo para la región de América del Norte
ventas_NA <- juegos2015_2016[, c("Genre", "NA_Sales")]

# Sumar las ventas por género
ventas_NA <- aggregate(NA_Sales ~ Genre, data = ventas_NA, FUN = sum)

# Ordenar los géneros por ventas en América del Norte
ventas_NA <- ventas_NA[order(ventas_NA$NA_Sales, decreasing = TRUE), ]

# Crear el gráfico de barras
barplot(ventas_NA$NA_Sales,
        names.arg = unique(ventas_NA$Genre),
        col = "blue",
        main = "Ventas en América del Norte por Género de Videojuego",
        xlab = "Género",
        ylab = "Ventas en América del Norte",
        las = 2,
        cex.names = 0.7)

# Añadir etiquetas de valores encima de cada barra
text(x = barplot(ventas_NA$NA_Sales,
                 col = "blue",
                 ylim = c(0, max(ventas_NA$NA_Sales) * 1.1),
                 axes = FALSE,
                 main = "Ventas en América del Norte por Género de Videojuego",
                 xlab = "Género",
                 ylab = "Ventas en América del Norte"),
     y = ventas_NA$NA_Sales,
     labels = ventas_NA$NA_Sales,
     pos = 3,
     col = "black")

# Añadir una línea de referencia para la media de ventas
abline(h = mean(ventas_NA$NA_Sales),
       col = "red",
       lwd = 2,
       lty = 2)

# Agregar una leyenda
legend("topright",
       legend = c("Ventas en América del Norte", "Media de Ventas"),
       fill = c("blue", "red"),
       title = "Información",
       cex = 0.8)

Lo que podemos concluir es que los géneros de videojuegos que dominan en América del Norte , son primero “shooters”(Juegos de disparos), segundo juegos de “Acción”, tercero juegos de “Deportes” y cuarto juegos de “rol” ,según los juegos que superan la línea de media.

Estos datos son muy útiles ya que las empresa sabrán en qué tipo de juegos valen la pena invertir grandes cantidades con el objetivo de obtener ganancias en América del Norte.

Comparar las ventas en diferentes regiones con el género de videojuego: Europe

# Filtrar los datos solo para Europa
ventas_EU <- juegos2015_2016[, c("Genre", "EU_Sales")]

# Sumar las ventas por género
ventas_EU <- aggregate(EU_Sales ~ Genre, data = ventas_EU, FUN = sum)

# Ordenar los géneros por ventas en Europa
ventas_EU <- ventas_EU[order(ventas_EU$EU_Sales, decreasing = TRUE), ]

# Crear el gráfico de barras
barplot(ventas_EU$EU_Sales,
        names.arg = unique(ventas_NA$Genre),
        col = "green",
        main = "Ventas en Europa por Género de Videojuego",
        xlab = "Género",
        ylab = "Ventas en Europa",
        las = 2,
        cex.names = 0.7)

# Añadir etiquetas de valores encima de cada barra
text(x = barplot(ventas_EU$EU_Sales,
                 col = "green",
                 ylim = c(0, max(ventas_EU$EU_Sales) * 1.1),
                 axes = FALSE,
                 main = "Ventas en Europa por Género de Videojuego",
                 xlab = "Género",
                 ylab = "Ventas en Europa"),
     y = ventas_EU$EU_Sales,
     labels = ventas_EU$EU_Sales,
     pos = 3,
     col = "black")

# Añadir una línea de referencia para la media de ventas
abline(h = mean(ventas_EU$EU_Sales),
       col = "red",
       lwd = 2,
       lty = 2)

# Agregar una leyenda
legend("topright",
       legend = c("Ventas en Europa", "Media de Ventas"),
       fill = c("green", "red"),
       title = "Información",
       cex = 0.8)

En Europa los géneros de videojuegos que domian el mercado son iguales que los de America de Norte , siendo los géneros con más ventas shooters, acción, deporte y juegos de rol en el mismo orden superando la media.

Comparar las ventas en diferentes regiones con el género de videojuego: Japan

# Filtrar los datos solo para la región de Japón
ventas_JP <- juegos2015_2016[, c("Genre", "JP_Sales")]

# Sumar las ventas por género
ventas_JP <- aggregate(JP_Sales ~ Genre, data = ventas_JP, FUN = sum)

# Ordenar los géneros por ventas en Japón
ventas_JP <- ventas_JP[order(ventas_JP$JP_Sales, decreasing = TRUE), ]

# Crear el gráfico de barras
barplot(ventas_JP$JP_Sales,
        names.arg = unique(ventas_JP$Genre),
        col = "yellow",
        main = "Ventas en Japón por Género de Videojuego",
        xlab = "Género",
        ylab = "Ventas en Japón",
        las = 2,
        cex.names = 0.7)

# Añadir etiquetas de valores encima de cada barra
text(x = barplot(ventas_JP$JP_Sales,
                 col = "yellow",
                 ylim = c(0, max(ventas_JP$JP_Sales) * 1.1),
                 axes = FALSE,
                 main = "Ventas en Japón por Género de Videojuego",
                 xlab = "Género",
                 ylab = "Ventas en Japón"),
     y = ventas_JP$JP_Sales,
     labels = ventas_JP$JP_Sales,
     pos = 3,
     col = "black")

# Añadir una línea de referencia para la media de ventas
abline(h = mean(ventas_JP$JP_Sales),
       col = "red",
       lwd = 2,
       lty = 2)

# Agregar una leyenda
legend("topright",
       legend = c("Ventas en Japón", "Media de Ventas"),
       fill = c("yellow", "red"),
       title = "Información",
       cex = 0.8)

En el caso del mercado japonés, los resultados de dominio de género de videojuegos es algo diferente podemps observar que el orden de domino cambia, los juegos de acción dominan como primeros , luego los juegos de rol , tercero los shooter y cuarto los de simulación. En conclusión, si las industrias de videojuego quiere llegar a Japón no es recomendado que traigan juegos de deportes que ya son exitosos en Europa y América por ende deben cambiar el orden de prioridad en la ventas de videojuegos siendo recomendado traer más juegos de simulación y cumplir la demanda de juegos de acción más que los de genero shooter.

Comparar las ventas en diferentes regiones con el género de videojuego: Other regions

# Filtrar los datos solo para la región de Otras regiones
ventas_Other <- juegos2015_2016[, c("Genre", "Other_Sales")]

# Sumar las ventas por género
ventas_Other <- aggregate(Other_Sales ~ Genre, data = ventas_Other, FUN = sum)

# Ordenar los géneros por ventas en Otras regiones
ventas_Other <- ventas_Other[order(ventas_Other$Other_Sales, decreasing = TRUE), ]

# Crear el gráfico de barras
barplot(ventas_Other$Other_Sales,
        names.arg = unique(ventas_JP$Genre),
        col = "light blue",
        main = "Ventas en Otras regiones por Género de Videojuego",
        xlab = "Género",
        ylab = "Ventas en Otras regiones",
        las = 2,
        cex.names = 0.7)

# Añadir etiquetas de valores encima de cada barra
text(x = barplot(ventas_Other$Other_Sales,
                 col = "light blue",
                 ylim = c(0, max(ventas_Other$Other_Sales) * 1.1),
                 axes = FALSE,
                 main = "Ventas en Otras regiones por Género de Videojuego",
                 xlab = "Género",
                 ylab = "Ventas en Otras regiones"),
     y = ventas_Other$Other_Sales,
     labels = ventas_Other$Other_Sales,
     pos = 3,
     col = "black")

# Añadir una línea de referencia para la media de ventas
abline(h = mean(ventas_Other$Other_Sales),
       col = "red",
       lwd = 2,
       lty = 2)

# Agregar una leyenda
legend("topright",
       legend = c("Ventas en Otras regiones", "Media de Ventas"),
       fill = c("light blue", "red"),
       title = "Información",
       cex = 0.8)

En caso de Otras regiones tienen una preferencia muy parecida que Japón.

En conclusión general, los géneros que mas conviene que inviertan las compañías de videojuegos son los de acción, shooter(disparos), juegos de rol y para América de Norte y Europa los juegos de deportes.Por otro lado, en Japón y otras regiones los de simulación venden mejor que los de deportes.

Al realizar el análisis de estos gráficos de barras para cada región, se puede observar claramente la relación entre las ventas y los géneros de videojuegos en cada región específica. Los géneros más vendidos se representan con barras más altas, y se puede comparar la distribución de las ventas entre las diferentes regiones. También se puede identificar fácilmente el género correspondiente a cada barra gracias a las etiquetas colocadas debajo de las barras. Además, la línea de referencia de la media de ventas proporciona una referencia para evaluar el rendimiento de cada género en comparación con el promedio en la región.

Tabla de ventas totales en cada región

# Agrupar y sumar las ventas por región
ventas_totales <- aggregate(cbind(NA_Sales, EU_Sales, JP_Sales, Other_Sales) ~ 1, data = juegos2015_2016, FUN = sum)

# Cambiar los nombres de las columnas
colnames(ventas_totales) <- c("Ventas totales en Norte America", "Ventas totales en Europa", "Ventas totales en Japon", "Ventas totales en Otras regiones")

# Ordenar los totales de ventas de mayor a menor
ventas_totales <- ventas_totales[order(ventas_totales$`Ventas totales en Norte America` + ventas_totales$`Ventas totales en Europa` + ventas_totales$`Ventas totales en Japon` + ventas_totales$`Ventas totales en Otras regiones`, decreasing = TRUE), ]

# Mostrar la tabla de totales de ventas
ventas_totales

Algunas formas en las que esta tabla podría ser útil en el estudio incluyen:

Comparación de ventas por región: Esto te permitirá identificar las regiones más fuertes en términos de ventas de videojuegos.

Identificación de patrones regionales: Al tener los totales de ventas desglosados por región, se podrá identificar patrones específicos en cada región. Por ejemplo, es posible que ciertos géneros de videojuegos sean más populares en una región en particular, lo que podría ser útil para la segmentación de mercado.

Esta tabla de totales de ventas por región proporciona una visión general de las ventas de videojuegos en diferentes regiones, lo que puede ayudar a comprender mejor el mercado y tomar decisiones informadas en tu estudio o análisis relacionado con los videojuegos.

Analizar cuáles fueron los distribuidores de videojuegos con más publicaciones.

# Analizar cuáles fueron los distribuidores de videojuegos con más publicaciones.
#names(juegos2015_2016)
##Cuales son los distribuidores de videojuegos
data_distribuidor= juegos2015_2016$Publisher

Distribuidores= unique(data_distribuidor)
Distribuidores ##todos los distribuidores que hay 
##  [1] "Electronic Arts"                       
##  [2] "Bethesda Softworks"                    
##  [3] "Sony Computer Entertainment"           
##  [4] "Microsoft Game Studios"                
##  [5] "Activision"                            
##  [6] "Nintendo"                              
##  [7] "Namco Bandai Games"                    
##  [8] "Warner Bros. Interactive Entertainment"
##  [9] "Take-Two Interactive"                  
## [10] "Ubisoft"                               
## [11] "Konami Digital Entertainment"          
## [12] "Square Enix"                           
## [13] "Hello Games"                           
## [14] "Sony Computer Entertainment Europe"    
## [15] "Slightly Mad Studios"                  
## [16] "Capcom"                                
## [17] "Codemasters"                           
## [18] "Focus Home Interactive"                
## [19] "Harmonix Music Systems"                
## [20] "505 Games"                             
## [21] "Deep Silver"                           
## [22] "Sega"                                  
## [23] "Nippon Ichi Software"                  
## [24] "Kalypso Media"                         
## [25] "FuRyu"                                 
## [26] "Atlus"                                 
## [27] "Milestone S.r.l."                      
## [28] "Rebellion Developments"                
## [29] "Marvelous Interactive"                 
## [30] "Tecmo Koei"                            
## [31] "Marvelous Entertainment"               
## [32] "PQube"                                 
## [33] "Paradox Interactive"                   
## [34] "Yacht Club Games"                      
## [35] "Telltale Games"                        
## [36] "Tru Blu Entertainment"                 
## [37] "Crytek"                                
## [38] "Bigben Interactive"                    
## [39] "inXile Entertainment"                  
## [40] "CCP"                                   
## [41] "Insomniac Games"                       
## [42] "Aksys Games"                           
## [43] "Idea Factory International"            
## [44] "Nordic Games"                          
## [45] "Revolution Software"                   
## [46] "Xseed Games"                           
## [47] "Tripwire Interactive"                  
## [48] "Dusenberry Martin Racing"              
## [49] "Milestone S.r.l"                       
## [50] "Rising Star Games"                     
## [51] "Alternative Software"                  
## [52] "Astragon"                              
## [53] "Gearbox Software"                      
## [54] "Introversion Software"                 
## [55] "Sold Out"                              
## [56] "Devolver Digital"                      
## [57] "Microids"                              
## [58] "Avanquest"                             
## [59] "Arc System Works"                      
## [60] "Stainless Games"                       
## [61] "Atari"                                 
## [62] "FuRyu Corporation"                     
## [63] "Unknown"                               
## [64] "Koch Media"                            
## [65] "Paradox Development"
"TABLA DE DISTRIBUIDORES"
## [1] "TABLA DE DISTRIBUIDORES"
tabla_de_distribudores=table(data_distribuidor)
tabla_de_distribudores
## data_distribuidor
##                              505 Games                             Activision 
##                                      8                                     30 
##                            Aksys Games                   Alternative Software 
##                                      4                                      1 
##                       Arc System Works                               Astragon 
##                                      1                                      2 
##                                  Atari                                  Atlus 
##                                      1                                      1 
##                              Avanquest                     Bethesda Softworks 
##                                      2                                     10 
##                     Bigben Interactive                                 Capcom 
##                                      4                                     12 
##                                    CCP                            Codemasters 
##                                      1                                      6 
##                                 Crytek                            Deep Silver 
##                                      1                                     12 
##                       Devolver Digital               Dusenberry Martin Racing 
##                                      1                                      1 
##                        Electronic Arts                 Focus Home Interactive 
##                                     37                                      8 
##                                  FuRyu                      FuRyu Corporation 
##                                      1                                      1 
##                       Gearbox Software                 Harmonix Music Systems 
##                                      2                                      2 
##                            Hello Games             Idea Factory International 
##                                      1                                      2 
##                        Insomniac Games                  Introversion Software 
##                                      3                                      2 
##                   inXile Entertainment                          Kalypso Media 
##                                      1                                      4 
##                             Koch Media           Konami Digital Entertainment 
##                                      1                                     10 
##                Marvelous Entertainment                  Marvelous Interactive 
##                                      1                                      3 
##                               Microids                 Microsoft Game Studios 
##                                      3                                      9 
##                        Milestone S.r.l                       Milestone S.r.l. 
##                                      4                                      5 
##                     Namco Bandai Games                               Nintendo 
##                                     35                                     27 
##                   Nippon Ichi Software                           Nordic Games 
##                                     14                                      9 
##                    Paradox Development                    Paradox Interactive 
##                                      1                                      3 
##                                  PQube                 Rebellion Developments 
##                                      6                                      3 
##                    Revolution Software                      Rising Star Games 
##                                      2                                      2 
##                                   Sega                   Slightly Mad Studios 
##                                      8                                      3 
##                               Sold Out            Sony Computer Entertainment 
##                                      2                                     13 
##     Sony Computer Entertainment Europe                            Square Enix 
##                                      1                                     15 
##                        Stainless Games                   Take-Two Interactive 
##                                      2                                     27 
##                             Tecmo Koei                         Telltale Games 
##                                     10                                      2 
##                   Tripwire Interactive                  Tru Blu Entertainment 
##                                      1                                      1 
##                                Ubisoft                                Unknown 
##                                     36                                      1 
## Warner Bros. Interactive Entertainment                            Xseed Games 
##                                     28                                      1 
##                       Yacht Club Games 
##                                      4
"Numero de distribuidores en TOTAL"
## [1] "Numero de distribuidores en TOTAL"
numero_de_distribuidores=length(tabla_de_distribudores)
numero_de_distribuidores ### hay 65 distribuidores
## [1] 65
"GRAFICA EN BARRAS DE LOS MAYORES DISTRIBUIDORES"
## [1] "GRAFICA EN BARRAS DE LOS MAYORES DISTRIBUIDORES"
tabla_distribuidor_ordenado= sort(tabla_de_distribudores,decreasing = TRUE) ##Tabla ordenada de forma descendente
#tabla_distribuidor_ordenado
cinco_mas_reptido= head(tabla_distribuidor_ordenado,4)
cinco_mas_reptido
## data_distribuidor
##    Electronic Arts            Ubisoft Namco Bandai Games         Activision 
##                 37                 36                 35                 30
barplot(cinco_mas_reptido,main = "Los mayores disbuidores de juegos de 2015 y 2016",xlab = "Distribuidor",ylab = "Numero de juego que a distribuidos")

#barplot(tabla_de_distribudores,main = "Los  disbuidores de juegos de 2015 y 2016",xlab = "Distribuidor",ylab = "Numero de juego que a distribuidos")

En el mundo de videojuegos como es un mercado tan grande que lo consumen en todas partes, las desarrolladora de videojuegos no pueden abastecer la demanda , la distribución o no tienen el suficiente financiamiento para sus proyectos, por ello hacen contratos con distribuidoras grandes que se encargaran de esa parte del trabajo y les permitirán financiar sus proyectos, gracias a ello hay situaciones donde un juego puede superar la ventas de 10 millones en solo tres días de estreno, en esta grafica mostrada están los mejores distribuidores de juegos en 2015 a 2016, los cuales son los más confiables si se quiere lograr que al videojuego le vaya bien en el mercado.

Identificar patrones y tendencias de venta en la industria de los videojuegos entre 2015 y 2016, incluyendo los géneros de videojuegos más populares y las plataformas de juegos más utilizadas.

#Tendencia de las Plataformas más utilizadas


cantidad_plat <- table(juegos2015_2016$Platform) #Cantidad de plataformas utilizadas en los videojuegos

barplot(cantidad_plat,col="burlywood",main = "Plataformas de videojuegos más utlizadas entre 2015 y 2016",xlab = "Plataforma",ylab ="Cantidad de veces que se utilizó")

legend("topright",
       legend = c("Plataformas más utilizadas","Media de las plataformas"),
       fill = c("burlywood","red"),
       title = "Información",
       cex = 0.8)

abline(h = mean(cantidad_plat),
       col = "red",
       lwd = 2,
       lty = 2)

Con esta grafica no es muy útil para las desarrolladoras de videojuegos, para tener una idea en que plataforma vale la pena que adaptar su videojuego en este caso serian Ps4 ,Xone y Pc pero estos resultados cambian muy drásticamente cuando pasan 7 años o menos con la salida de nuevas generaciones de las plataforma. Como se aprecia es la Ps3 que casi no tiene publicaciones pero esto no afecte a la empresa que produce la consola sino a los consumidores de este producto ya que se queda sin contenido nuevo siendo obligados a actulizarse a una nueva consola por ende a comprar las nuevas actualizaciones.

#Tendencia de los generos más populares

cantidad_gen <- table(juegos2015_2016$Genre)
barplot(cantidad_gen,col="darkolivegreen2",main = "Popularidad de videojuegos por género entre 2015 y 2016",xlab = "Genero",ylab ="Preferencia")

legend("topright",
       legend = c("Popularidad de videojuegos","Media de la popularidad"),
       fill = c("darkolivegreen2","red"),
       title = "Información",
       cex = 0.8)

abline(h = mean(cantidad_plat),
       col = "red",
       lwd = 2,
       lty = 2)

En esta gráfica nos muestra en general los juegos más populares en todas las regiones con ello se puede concluir que la popularidad es más en el genéro Action y menos en Puzzle. Esto ya tendría que ver con los gustos y preferencias de los consumidores además cabe recalcar que también influye la calidad y experiencia que puede brindar el videojuego.

#Comparacion de que plataformas tuvieron mas demanda en el año 2015 y 2016
Tabla_Comparacion_1 = prop.table(table(juegos2015_2016$Year_of_Release,juegos2015_2016$Platform), margin = 1)*100
#La Tabla_Comparacion 1 nos dara el porcentaje de las diferentes plataformas durante el año 2015 y 2016
Tabla_Comparacion_1
##       
##               3DS         PC        PS3        PS4        PSV       WiiU
##   2015  8.5201794 14.7982063  0.4484305 38.5650224  5.8295964  8.5201794
##   2016  4.3103448 19.3965517  0.0000000 42.2413793  4.3103448  3.8793103
##       
##              XOne
##   2015 23.3183857
##   2016 25.8620690
#Imprimimos la tabla para visualizar el porcentaje de demanda en el año 2015 2016

#Usamos mosaicos para una visualizacion mejor
mosaicplot(Tabla_Comparacion_1 ,main = "Tabla de Comparación",xlab = "Años",ylab = "Juegos",color = c("green","blue","red","yellow","black","pink","orange"))

Con ayuda de este mosaico obtenemos cuales son las plataformas que tuvieron más demanda, tanto en el año 2015 y 2016. Las plataformas que tuvieron más demanda en el año 2015 fueron, la PC, el PS4 y el XOne. Ahora las plataformas que tuvieron más demanda en el año 2016 fueron también las mismas, es decir, la PC, la PS4 y el XOne. Pero eso no es todo ya que la demanda de ventas de estas plataformas aumentaron más en el 2016 que en el 2015 y también se observa la caída de publicaciones en la consola psv, 3ds, ps3 y WIU, siendo la más preocupante la de WIU departe de NINTENDO porque es una consola de nueva generación que se supone que debería competir con los más grandes .

Ahora veremos que porcentaje aumentaron dichas plataformas

resta_PC = round(abs((Tabla_Comparacion_1[1,2])-(Tabla_Comparacion_1[2,2])),3)
resta_PC
## [1] 4.598
resta_PS4 = round(abs((Tabla_Comparacion_1[1,4])-(Tabla_Comparacion_1[2,4])),3)
resta_PS4
## [1] 3.676
resta_Xone = round(abs((Tabla_Comparacion_1[1,7])-(Tabla_Comparacion_1[2,7])),3)
resta_Xone
## [1] 2.544

La plataforma PC aumento un 4.598% de demanda en el año 2016 del total de las plataformas del año 2015. La plataforma PS4 aumento un 3.676% de demanda en el año 2016 del total de las plataformas del año 2015. La plataforma XOne aumento un 2.544% en el 2016 del total de las plataformas de el año 2015.

#Comparacion en que año las plataformas de videojuegos tuvieron mas demanda.
Tabla_Comparacion_2 = prop.table(table(juegos2015_2016$Year_of_Release,juegos2015_2016$Platform), margin = 2)*100
#La Tabla_Comparacion 2 nos dara el porcentaje de las diferentes plataformas, para asi saber en que año tuvo mas demanda.
Tabla_Comparacion_2
##       
##              3DS        PC       PS3       PS4       PSV      WiiU      XOne
##   2015  65.51724  42.30769 100.00000  46.73913  56.52174  67.85714  46.42857
##   2016  34.48276  57.69231   0.00000  53.26087  43.47826  32.14286  53.57143
#Usamos mosaicos para una visualizacion mejor.
mosaicplot(Tabla_Comparacion_2 ,main = "Tabla de Comparación",xlab = "Años",ylab = "Juegos",color = c("green","blue","red","yellow","black","pink","orange"))

Al analizar la gráfica del mosaico podemos decir lo siguiente.

Que algunas plataformas aumentaron su demanda, otras dismunuyeron y otras que ya no tuvieron demanda.

Analizando la gráfica de mosaico la plataformas 3DS y WiiU tuvieron una mayor demanda en el año 2015 respecto al 2016. Es decir, disminuyeron su demanda para el año 2016.

Analizando la gráfica de mosaico la plataforma de PC, la plataforma XOne y la plataforma PS4 tuvieron una mayor demanda en el año 2016 respecto al 2015, esto nos quiere decir que sus demandas aumentaron para el año 2016

Ahora analizando nuevamente la gráfica de mosaico, nos damos cuenta que la PC3 tuvo una mayor demanda en el 2015, pero que paso en el 2016. No tuvo muchas demandas. Con esto podemos decir que como hubo un nuevo lanzamiento de la PS4, estas que venían con mejoras y una calida gráfica lo convirtio en una opcion mucho mas atractiva para los jugadores activos. Además, muchas empresas que desarrollan los juegos para la PS3 dejaron de hacerlo y se centraron mas en crear juegos para la PS4, ya que los jugadores desean jugar los juegos mas recientes y actualizarse a las mejoras.

Resumen del análisis.

  1. Los juegos que dominaron mas en el año 2015 y 2016 fueron la PC, el PS4 y el XOne.
  2. Algunas plataformas que disminuyeron su demanda para el año 2016 fueron: 3DS, PSV y WiiU, y las otras plataformas como: PC, PS4 y XOne aumentaron.
  3. Finalmente las PS3 bajo su demanda drasticamente para el año 2016.

Puntuación promedio por cada Género

#Separamos la data que usaremos
genero <- juegos2015_2016[, c("Genre", "Critic_Score")]
#Calculamos el promedio para cada genero
genero_promediado <- aggregate(Critic_Score ~ Genre, data = genero, FUN = mean)
#Ordenamos los promedios de mayor a menor para tener una mejor visualización
genero_promediado <- genero_promediado[order(genero_promediado$Critic_Score, decreasing = TRUE), ]
#Redondeamos el promedio a dos decimales
genero_promediado$Critic_Score <- round(genero_promediado$Critic_Score,2)
#Graficamos 
barplot(genero_promediado$Critic_Score,
        names.arg = unique(ventas_JP$Genre),
        col = "light green",
        main = "Puntuacion promedio de cada genero",
        xlab = "Género",
        ylab = "Puntuacion Promedio",
        las = 2,
        cex.names = 0.7)

text(x = barplot(genero_promediado$Critic_Score,
                 col = "light green",
                 ylim = c(0, max(genero_promediado$Critic_Score) * 1.3),
                 axes = FALSE,
                 main = "Puntuacion promedio de cada genero",
                 xlab = "Género",
                 ylab = "Puntuacion Promedio"),
     y = genero_promediado$Critic_Score,
     labels = genero_promediado$Critic_Score,
     pos = 3,
     col = "black")
legend("topright",
       legend = c("Puntuacion promedio por género"),
       fill = c("light green"),
       cex = 0.6)

Al realizar este análisis podemos ver en la gráfica no hay mucha variación en la puntuación, pero también podemos deducir cuales son los 3 primeros géneros que llaman más la atención de la población, por ende podemos aumentar el número de videojuego en el mercado variando el tipo entre estos tres géneros.También con esta información les servirá a los creadores a mejorar la calidad de los videojuegos.

Tendencias de clasificaciones de edad por género de videojuego

library(ggplot2)
ggplot(juegos2015_2016, aes(x = Rating, fill = Genre)) +
  geom_bar() +
  labs(x = "Clasificación de edad", y = "Frecuencia", title = "Distribución de clasificaciones de edad por género de videojuego")

Este tipo de gráfico brinda una visión general de cómo se distribuyen las clasificaciones de edad en cada género de videojuegos. Se puede observar las diferencias relativas entre los géneros y determinar si hay géneros específicos que tienden a tener ciertas clasificaciones de edad con más frecuencia.

Por ejemplo, se puede apreciar que el género de “Shooter” tiende a tener una mayor proporción de clasificaciones de edad “M” (para 17 años o más), mientras que el género de “Plataformas” se inclina más hacia clasificaciones “E” (para todas las edades), esto podría proporcionar información relevante sobre las preferencias de clasificación de edad en diferentes géneros de videojuegos.